Skip to main content

Slimshadys's group workspace

Timestamps visible
2023-12-12 08:45:27
--------BEGIN ITERATION REPORT--------
2023-12-12 08:45:27
Policy Reward: 34,81264
2023-12-12 08:45:27
Policy Entropy: 0,00164
2023-12-12 08:45:27
Value Function Loss: 0,07488
2023-12-12 08:45:27
Mean KL Divergence: 0,00059
2023-12-12 08:45:27
SB3 Clip Fraction: 0,00102
2023-12-12 08:45:27
Policy Update Magnitude: 0,05715
2023-12-12 08:45:27
Value Function Update Magnitude: 0,24121
2023-12-12 08:45:27
Collected Steps per Second: 8.381,67897
2023-12-12 08:45:27
Overall Steps per Second: 6.493,70167
2023-12-12 08:45:27
Timestep Collection Time: 5,96969
2023-12-12 08:45:27
Timestep Consumption Time: 1,73563
2023-12-12 08:45:27
PPO Batch Consumption Time: 0,14700
2023-12-12 08:45:27
Total Iteration Time: 7,70531
2023-12-12 08:45:27
Cumulative Model Updates: 2.933
2023-12-12 08:45:27
Cumulative Timesteps: 49.022.830
2023-12-12 08:45:27
Timesteps Collected: 50.036
2023-12-12 08:45:27
--------END ITERATION REPORT--------
2023-12-12 08:45:27
Saving checkpoint 49022830...
2023-12-12 08:45:27
Checkpoint 49022830 saved!